研习社 | 学员作业:基于实时交通出行数据的武汉主城区居民生活便利性评价
基于城市实时交通出行数据的居民生活
便利度研究
以武汉市二环线内试点城中村为例
大家好,我叫萧俊瑶,是一名即将毕业的大四学生,来自华中师范大学城市与环境科学学院,专业为人文地理与城乡规划。去年暑假,我偶然间在国匠城看到有关城市数据研习社的推送,当场就被研习社的学习内容深深吸引,于是毫不犹豫地加入到研习社的“伐木累”中。前几个月的课程学习让我这个“数据小白”快速入门,并将所学应用到专业实习里。后来由于要准备考研初试,我不得不放弃前两期的工作营,为此我还感到十分遗憾。于是,在得知研习社开启新一轮的“学期计划”后,我便趁着复试前夕参加了第一期,而这次专题研究令我获益匪浅。
1 研究概述
城中村改造是城镇化进程和城市更新浪潮下的必然趋势,如今也在全国各大城市内积极展开。在此背景下,本研究以城中村为切入点研究居民生活便利度,一方面是为通过练习掌握数据处理的技能,另一方面也为紧随时代热点,期望以较严谨的学术态度关注和分析社会现象。
1.1 研究对象
武汉市“城中村”首批综合改造试点村有15个村,分别是江岸区竹叶山、新荣村,江汉区航侧、鲩子湖、贺家墩村,硚口区汉西、罗家墩村,汉阳区十里铺、前进村,武昌区紫阳、沙湖村,洪山区团结、徐东、洪山、井冈村。这些“城中村”均位于武汉市二环线内。受数据来源限制,本文选取除武昌区2个村以外的其他13个“城中村”作为研究对象。
图1 研究对象“城中村”地理位置
1.2 研究内容
本研究所指的居民生活便利度,主要表达为居民在一定时间内能到达设施点的数量多少及种类齐全度,出行时间越短,设施数量越多,种类越齐全,则认为居民的生活便利度越高。
具体而言,研究以试点城中村为起始点计算不同出行时间的等时圈范围,通过统计等时圈范围的设施POI点数量和种类,得到每个村不同等时圈的便利程度,再通过建立设施点的评价指标体系,得到每个村的总体便利程度。
2 数据来源与处理
数据来源方面,本研究所用数据均为向城市数据研习社申请所得,所有操作均在统一的投影坐标系(WGS_1984_UTM_Zone_49N)中进行,在此不对该步骤进行赘述。数据处理方面,主要分为三步:
2.1 出行时间和出行距离数据的获取
出行时间和出行距离数据是基于起点到终点的出行数据。数据的获取涉及到选取起点、选取终点、出行方式的确定等几个关键步骤。
2.1.1 起点的选取
首先,从城市数据研习社获取了武汉市街道级别的行政边界数据,从中提取城中村的面要素;接着,对面要素其进行“要素转点”操作,即可得到研究对象“城中村”的点要素,以此作为出行“起点”。
2.1.2 终点的选取
通过“创建渔网”工具将武汉市主城区简化为1000*1000,同时提取网格的重心带你,以此作为出行“终点”,一共得到1428个渔网点。
2.1.3 交通方式的确定
“城市实时交通出行数据”可以选择公共交通、驾车、骑行、步行四种交通方式,介于住在城中村的村民大多收入偏低,出行方式主要以公共交通为主,因此,本研究选择公共交通方式。
2.1.4 爬取出行时间和出行距离数据
爬取每个起点到每个终点的基于公共交通出行的出行时间和出行距离,最终得到18000+条数据。
图2 OD示意图
2.2 等时圈计算
由于后续的数据处理需要对每个村进行单独计算,即对每个起点所含数据单独计算,而本研究起点数较多,共计13组,申请所得OD数据又均在同一个excel文件中,所以方便起见,笔者首先需要建立一个模型,将所有数据按起点分组导出。此过程关键在【迭代要素选择】和【要素类至要素类】两个工具,具体步骤为:
① 将申请所得“结果数据.xls”在ArcMap中按经纬度坐标转为shapefile文件,得到空间版的“结果数据.shp”;
② 打开模型构建器(Modlebuilder),右键选择迭代器中的【要素选择】,以“结果数据.shp”为输入要素,按oid字段(用于标识起点)进行分组;
③ 随后添加【要素类至要素类】工具,以上一步的分组结果为输入要素,输出要素类为迭代的{值},
④ 得到以oid字段命名的13个shp文件,即为13个城中村的出行数据。Modlebuilder模型如下:
图3 数据分组模型
各村数据单独分出后,接下来则进行正式的等时圈计算。整体思路上,笔者运用【反距离权重法】对所有起点按“公交路线总耗时”进行插值运算,然后对运算结果以10min,15min,30min,1h,2h为间隔进行【重分类】。Modlebuilder模型如下:
图4 等时圈计算模型
经过以上步骤,我们可得到13个村公交出行10min以内,10~15min,15~30min,30min~1h,1~2h,2h以上的空间分布情况,即13个村不同时段等时圈的空间覆盖范围。
图5 城中村等时圈范围
2.3 POI点的清理与分类
为方便后期评价指标体系的建构,首先要对研习社提供的武汉市设施点数据进行清洗和分类。本研究选取购物、餐饮、教育、娱乐、医疗和生活6大类作为影响居民生活便利度的主要设施,依据爬取的POI设施点标签,笔者按个人对设施点使用频繁度的理解又对这6大类进行22个小类的划分,划分结果和过程如下:
表1 居民生活设施分类
对数据清洗和分类完毕后,在ArcMap中将所有设施点【合并】为一个图层“综合设施点.shp”,即可得到武汉市所有经分类后的设施点数据。接着按各村10min以内,10~15min,15~30min,30min~1h范围(上一步等时圈计算中已得出)分别导出“综合设施点”的 dbf,以便后期在Excel中对设施点进行数量和种类的统计分析。具体用到的工具有【按属性选择图层】、【按位置选择图层】和【表至表】。Modlebuilder模型如下:
图6 等时圈内设施点导出模型
经以上处理,我们可分别得到13个村不同等时圈的设施点数据。
2.4 评价体系的建构
该部分主要借助Yaahp软件,采用专家打分法和层次分析法相结合的方法,对评价指标进行两两比较和重要性分析,构建评价指标的判断矩阵,并通过一致性检验,得到评价因子的权重。具体到本研究,就是将购物、餐饮、教育、娱乐、医疗和生活6大类作为一级因子,将便利店、甜品店、学校等22小类作为二级因子,利用Yaahp软件对同级因子进行两两比较,最终得到各个类别的权重。权重越大,表示日常使用度越频繁,对居民生活便利度影响越大。据此,我们得到的结果如下:
图7 居民生活便利度评价指标体系
3 基于出行等时圈的城中村生活便利度分析
3.1 各城中村出行等时圈分析
该阶段分析主要为了解各城中村的基于公共交通的可达性状况。从表2可看出,1小时范围内鲩子湖村和十里铺村公交可达的面积最大,井岗村和罗家墩村公交可达面积最小;15分钟范围内,前进村、洪山村和竹叶山村的可达面积最大;15分钟到1小时范围内,鲩子湖村和十里铺村的可达面积最大。罗家墩村的可达面积在各个时段都处于最低水平。可见,前进村在短时间内公交可达性最强,鲩子湖和十里铺村在中长时间内公交可达性最强,罗家墩村的公交可达性最弱。
表2 公交等时圈覆盖面积
图8 公交等时圈覆盖面积
在此,以鲩子湖村和罗家墩村为例探讨其公交可达性状况。这两个村的特点非常突出,15分钟范围内,它们的公交可达面积低至0,说明两村周边的公交系统均不完善。15分钟到1小时内,鲩子湖的公交可达面积大幅增加,而罗家墩村的公交可达面积依旧很小。这与两地所处区域有关,鲩子湖村位于江汉区,靠近长江沿岸的经济发达的老城区,交通基础设施建设相对完善,从图9可看出,鲩子湖村1小时覆盖范围与交通线路,特别是过江大桥的位置息息相关。罗家墩村位于硚口区,毗邻汉江和二环线,与鲩子湖村相比远离长江沿岸的市中心,该区经济发展相对落后,发展历史较短,故公交系统方面较不完善,公交可达性差。另外,从两村1小时内覆盖范围的特点也可看出,鲩子湖村可达面积主要沿跨江大桥的方向延伸,罗家墩村南部受汉江阻隔,整体可达面积沿东西方向延伸,表明武汉地区的交通通达性与水系息息相关。
图9 鲩子湖村等时圈范围
图10 罗家墩村等时圈范围
图11 各村在地图上的相对位置
3.2 各城中村设施点数量分析
从各村4个等时圈所含设施点个数看,15分钟以内十里铺村设施点数量最多,鲩子湖村和罗家墩村设施点数量最少,且数量为0;15分钟~30分钟范围内,鲩子湖村设施点数量最多,罗家墩村数量最少;30分钟~1小时内,十里铺村设施点数量最多,罗家墩村数量依旧最少。总体而言,从设施点数量的角度看,在13个城中村中,十里铺村便利度最高,罗家墩村便利度最低。
结合等时圈覆盖范围分析,鲩子湖村和罗家墩村15分钟内公交可达性差,故在此范围内无设施点分布,但并不意味着现实中两村附近没有设施点分布。将十里铺等时圈与设施点结合(图12)可看出,设施点在长江沿岸的江汉路片区和武昌片区分布密集,在十里铺周边也有密集分布区,且这些片区均在十里铺1小时公交可达范围内,这就保证了十里铺村在各个时段均可到达设施点密集区,居民生活的便利程度高。
表3 城中村等时圈内设施点总量
图12 等时圈内城中村所含设施点数量
图13 十里铺村等时圈与设施点覆盖图
3.3 各城中村设施点种类分析
该阶段分析主要探讨各城中村等时圈范围内设施点的齐全程度,以判断设施是否能够满足居民生活多样化的需求。设施点的种类如前所述按6大类,22小类分。
以10分钟范围内设施点种类情况为例,8/13的城中村含所有大类设施点,其余5个城中村中,汉西村缺少娱乐和医疗设施,贺家墩村缺少医疗设施,前进村缺少娱乐设施,而鲩子湖村及罗家墩村未含任何设施点。十里铺村和竹叶山村的设施点种类最多,小类均达20种,两个村都缺少文化馆,十里铺村还缺专科医院,竹叶山村还缺少运动场所。从设施点的角度看,文化馆是所有城中村在10分钟内都不能乘公交到达的,这与该类设施的稀少性有关。除鲩子湖村和罗家墩村外,所有城中村10分钟内有均餐馆酒楼覆盖,符合我们的现实生活情况。由此可见,10分钟的公交出行范围内,十里铺村和竹叶山村更能满足居民生活多样性的需求。汉西村亟需完善娱乐和医疗设施,贺家墩村需要增加一定的医疗设施,前进村也需要增加相应的娱乐设施。
结合10~15分钟的种类数据,在15分钟的公交出行范围内,十里铺村的设施点种类最多,鲩子湖村和罗家墩村因公交等时圈的原因(如前所述),依旧未含任何设施点。前进村依旧缺乏娱乐设施,而汉西村在10~15分钟里已有娱乐和医疗设施覆盖,贺家墩村也在这段时间内解决医疗设施不可达的问题。
15~30分钟范围内,所有城中村都包含所有大类设施点,11个村还包含了所有小类设施点。在此情况下,贺家墩村和罗家墩村依旧缺少文化馆,其中罗家墩村还缺少展览馆和综合医院。
30分钟以上,则所有城中村都能到达所有类型的设施点。
综上所述,从设施点种类的角度看,在13个城中村中,十里铺村便利度最高,罗家墩村便利度最低。
表4 10min内各村设施点种类情况
图14 等时圈内城中村所含设施点种类(%)
3.4 各城中村设施点综合评分
经过前几轮比较浅显的描述性分析,这一阶段的居民便利度分析转入定量研究。计算的整体思路为:
①计算某村某一等时圈范围内的居民生活便利度。
式中,t 表示某等时圈范围内居民生活便利度评价值,i表示某城中村,j表示某种设施,n表示小类设施点(共22个),xij表示某城中村某类设施的个数,Wj表示某类设施的权重值。
以汉西村为例,ti10、ti15、ti30、ti60 则分别代表汉西村10分钟范围内、10~15分钟范围内、15~30分钟范围内和30分钟~1小时范围内的居民生活便利度。根据表5(汉西村各公交等时圈内设施点数)和图7(居民生活便利度评价指标体系)所提供的数据,进行如下计算:
ti10=6×0.024+1×0.085+1×0.043+3×0.057+2×0.111+1×0.018=1.4622
ti15=1×0.151+1×0.014+2×0.003+14×0.057+2×0.164+7×0.111+25×0.034+2×0.098=3.1206
ti30=64×0.052+90×0.021+235×0.151+597×0.024+34×0.085+107×0.043+3×0.017+10×0.008+108×0.056+37×0.014+20×0.01+24×0.002+45×0.003+49×0.016+27×0.006+747×0.057+33×0.013+138×0.164+89×0.111+28×0.018+1266×0.034+166×0.098=144.3434
ti60=2849×0.164+5424×0.151+……+724×0.003+393×0.002=4398.946
表5 汉西村各公交等时圈内设施点数
② 对某村某一等时圈范围内的居民生活便利度进行标准化。
式中,T表示某等时圈范围内居民生活便利度标准化评价值,N表示城中村(共13个)。
该步骤在excel中用标准差公式进行。以10分钟等时圈为例,结果如下(表6):
表6 10min等时圈各村居民便利度评价值
③ 计算综合时段居民生活便利度
式中,z表示综合时段居民生活便利度。根据时间越短,便利度越高的原则,对不同时段等时圈赋予不同的值,其中10分钟内赋值为10,10~15分钟内赋值为7,15~30分钟内赋值为4,30分钟~1小时赋值为1,再将居民生活便利度标准化评价值与其相乘相加,得到某村综合时段的居民生活便利度值。
以汉西村为例,结合表7(汉西村居民便利度标准化评价值)进行如下计算:
z汉西村=(-0.6870)×10+ (-0.5166) ×7+(-0.4517) ×4+0.4353=-3.9749
表7 汉西村居民便利度标准化评价值
④ 对综合时段居民生活便利度进行标准化
式中,Z表示综合时段居民生活便利度标准化评价值。
该步骤在excel中用标准差公式进行。结果如下(表8):
表8 各村居民生活便利度评价值
图15 各村居民生活便利度比较
表8显示,13个村中十里铺村的居民生活便利度最高,罗家墩村的便利度最低,只有4个村的居民生活便利度在平均水平以上,分别是十里铺村、团结村、徐东村和竹叶山村。从图15可看出,只有十里铺村和竹叶山村各时段便利度均高于平均值,罗家墩村和新荣村各时段便利度均低于平均值。鲩子湖村虽然15分钟~1小时中的两个时段便利度远高于平均值,但由于短时间内的便利度过低,导致整体的便利度低于平均值。
4 反思与感想
虽然探索方法的过程磕磕绊绊,得到一点成果就兴奋不已,但不可忽视的是,就本研究来说,需要改进的地方还有很多。①影响居民生活便利度的设施不够齐全,如银行;②评价指标体系的确定为笔者根据个人理解建立,所得权重值带有一定主观性;③分析过程以数据描述为主,缺少对各村的实证研究;④未能结合“城中村”这一特殊产物进行深入探讨。
加入城市数据研习社可算是我2016年最有价值的决定之一。在这里我不仅学到高大上的软件,提高了数据分析和可视化表达能力,我还因此结交志同道合的朋友,与同行的交流让我对规划和数据产生更深的认识与热爱。衷心感谢数据团各位老师的辛勤指导和尽心服务,祝愿这个有爱的团体越办越好!
萧俊瑶,已参加由国匠城和城市数据团共同举办的《面向规划实践的数据能力增强计划》,具备城市数据综合分析能力,特此颁发认证,以资鼓励。
证书查询网址:www.caup.net/cert
【优秀学员丨郭 翰】北京主城区人口聚集与街道拥堵分析
【优秀学员丨梁家俊】基于百度热力中山市中心城区结构分析
城市数据研习社
2016年8月,由国匠城与城市数据团联合成立的城市数据研习社,发起了面向城市规划行业的“千人计划”。 希望能够从规划师中首先招募1000人,组建城市数据学习社群,增强规划师的数据应用能力,提升整个行业的数据应用水平。在半年左右的时间内已有1000多位规划师加入研习社。研习社学员已覆盖国内外132所高校,114所设计院和103家其它企事业单位。
城市数据研习社咨询群:413942566
长按识别二维码,腾讯课堂
报名加入城市数据研习社